Exploration adaptative de graphes sous contrainte de budget
نویسندگان
چکیده
Nous nous intéressons dans cet article à l’exploration d’un graphe tel celui du Web ou d’un réseau social dans un contexte où les nœuds (et les arêtes qui en sont issues) sont découverts un à un, et où le nombre total de nœuds que l’on peut explorer est contraint. Le but est d’optimiser un score global du sous-graphe découvert, fonction monotone de scores élémentaires sur chaque nœud. Ce problème se pose en particulier quand on souhaite collecter les pages du Web correspondant à un sujet donné ou quand on utilise l’API du site d’un réseau social tel Twitter pour constituer un jeu de données centré sur d’un thème. Nous présentons une abstraction de ce problème faisant appel à deux composants principaux : une stratégie d’exploration et un estimateur du score des nœuds de la frontière du graphe. Nous montrons qu’une stratégie gloutonne est suffisante en pratique, et qu’il est possible de s’adapter aux caractéristiques de différents graphes en utilisant des estimateurs qui apprennent automatiquement les caractéristiques prédisant le mieux les scores des nœuds. Ces techniques sont appliquées à des des graphes réels issus de Wikipedia ou de Twitter.
منابع مشابه
Granularité des motifs de co-variations dans des graphes attribués dynamiques
Résumé. Découvrir des connaissances dans des graphes qui sont dynamiques et dont les sommets sont attribués est de plus en plus étudié, par exemple dans le contexte de l’analyse d’interactions sociales. Il est souvent possible d’expliciter des hiérarchies sur les attributs permettant de formaliser des connaissances a priori sur les descriptions des sommets. Nous proposons d’étendre des techniqu...
متن کاملRecherche adaptative de structures de régulation génétique
Résumé. Nous avons proposé un algorithme original de Fouille de Données, LICORN, afin d’inférer des relations de régulation coopérative à partir de données d’expression. LICORN donne de bons résultats s’il est appliqué à des données de levure, mais le passage à l’échelle sur des données plus complexes (e.g., humaines) est difficile. Dans cet article, nous proposons une extension de LICORN afin ...
متن کاملBudget Constrained Resource Allocation for Non-Deterministic Workflows on a IaaS Cloud
Many scienti c applications are described through work ow structures. Due to the increasing level of parallelism o ered by modern computing infrastructures, work ow applications now have to be composed not only of sequential programs, but also of parallel ones. Cloud platforms bring on-demand resource provisioning and pay-as-you-go payment charging. Then the execution of a work ow corresponds t...
متن کاملBudget Constrained Resource Allocation for Non-deterministic Workflows on an IaaS Cloud
Many scienti c applications are described through work ow structures. Due to the increasing level of parallelism o ered by modern computing infrastructures, work ow applications now have to be composed not only of sequential programs, but also of parallel ones. Cloud platforms bring on-demand resource provisioning and pay-as-you-go payment charging. Then the execution of a work ow corresponds t...
متن کاملXEWGraph : Outil de Visualisation et Analyse des Hypergraphes pour un Système d'Intelligence Economique
L’Intelligence Economique (ou Competitive Intelligence) est une démarche et un processus organisationnel qui permet à l’entreprise d’être plus compétitive, d’une part en surveillant l’environnement et ses changements, et d’autre part, en surveillant les changements internes. Les graphes sont parmi les outils les plus puissants de visualisation. Ils permettent d’afficher, tout type d’information...
متن کامل